“武汉新冠病毒来自人造病毒泄露”?对不起,你被骗了
最近,一个 “新冠病毒来自是石正丽团队泄露的”流言在网上轰轰烈烈的传播,再加上某以反科学为能事的某游戏集团董事长所谓"实名举报"的推波助澜,有愈演愈烈之势。昨天有其他事做就没管,今天仔细研究了下。一个结论是:这是一个毫无科学根据的阴谋论。下面就这个阴谋论的3个所谓“证据”进行分析(正文4000字,配图17张)。
一、“武汉新冠病毒来自于15年人工构建的‘嵌合病毒’”?
那个所谓的“嵌合病毒”论文全文见链接( https://www.nature.com/articles/nm.3985?fbclid=IwAR0iTTfDlT-uxNFPtvQH-xFrF6QaF1hKE1Ey2TPrEi17XfFUElbpUlAosDc )。但很显然,那些攻击的人蹩脚的“百度翻译”完全就没弄懂论文的意思(图1)。例如图一中说原文:【只要把蝙蝠身上的S蛋白里的ACE2这个受体开关一调】,但事实是Ace2蛋白并不存在于病毒s蛋白内,而是存在于哺乳细胞膜表面(另一些可以分泌到血管中)。在石的文章中,没有任何关于ACE2蛋白的调节工作。
图1 谣言文本内容
为了大家更好的理解,这里花一点工夫介绍下这篇论文讲了什么。
—————————以下是背景介绍————————
蝙蝠携带很多冠状病毒(包括SARS的祖先)现在大家都知道了,但是在蝙蝠中的冠状病毒如何获得感染人的能力,从而产生像SARS、新冠病毒这样的人类致病病毒,则是人们关心的重点。一般认为,在某些哺乳动物(中间宿主)体内,不同冠状病毒之间可以通过重组或变异,获得感染人类的能力。那么这个重组可能是什么样的?
现在知道,冠状病毒表面的S蛋白(spike protein)能够结合哺乳动物(包括人)细胞膜表面的血管紧张素转化酶2(ACE2),从而吸附在细胞上,进而在其它蛋白的帮助下侵染入细胞。但是研究发现,来自蝙蝠的类似SARS的病毒SHC014,它的S蛋白并不具结合人类细胞的能力(图2,红线)。于是石正丽课题组做了一个实验,将SHC014病毒的S蛋白基因,替换掉了一个小鼠来源的SARS病毒(名为MA15)中的S蛋白基因,从而构建了一个“嵌合”病毒,命名为SHC014-MA15(图2,蓝线,结构见图3)。这个病毒具有结合人ACE2蛋白、从而结合人呼吸道细胞的能力(图2,黄线)。随后石正丽团队基于这一成果进行了一系列其他实验。
图2 论文截图
图3 SHC014-MA15病毒基因组结构
———————以上是背景介绍———————
那么问题来了,这个被改造的“嵌合”病毒,是这次武汉新冠肺炎的元凶么?其实检测方法很简单:1,武汉新冠病毒基因组已经公布(链接:https://www.ncbi.nlm.nih.gov/nucleotide/NC_045512.2 ),2 来自蝙蝠的SHC014基因组也是已知的(链接:https://www.ncbi.nlm.nih.gov/nucleotide/KC881005.1 ),那么只要对比后者的S蛋白是否出现在武汉新冠病毒的基因组中即可。
通过对比,很不幸,1:武汉新冠病毒和来自蝙蝠SHC014病毒的基因组比较,并没有一致性(同源性不到80%,图4),2:蝙蝠SHC014的S蛋白基因,并不存在于武汉新冠病毒上,同源性只有不到74%(图5),3:即使翻译为蛋白质,氨基酸序列同源性也只有77%(图6),4:武汉新冠病毒和SARS病毒相比,其它序列也不同(图7),意味着武汉新冠病毒其他区域也并非来自石正丽论文中所用SARS病毒。这4条证据意味着二者之间具有极大的差异,并非同一来源。
图4 武汉新冠病毒和来自蝙蝠SHC014病毒的基因组比较
图5 蝙蝠SHC014的S蛋白基因,并不存在于武汉新冠病毒上
图6 蝙蝠SHC014的S蛋白氨基酸序列和武汉新冠病毒S蛋白氨基酸序列比较
图7 武汉新冠病毒和SARS病毒基因组序列比较
而另外一个佐证是,如果用武汉新冠病毒的S蛋白基因序列进行病毒中的BLAST,可以发现和它同源性最高的是几个武汉新冠病毒毒株(同源性100%),而和SHC014中的S蛋白基因同源性则只有77%,和其他蝙蝠体内的“原始病毒”S蛋白差异很大(图8),不可能来自于石正丽课题组所发表的“嵌合病毒SHC014-MA15”。
图8 武汉新冠病毒的S蛋白基因序列进行病毒中的BLAST结果
综上,通过一个简单的序列比较,就能戳穿那蹩脚的翻译及其背后的阴谋论。诚然,进行人工病毒改造的确具有一定的风险性,警示人们提高生物安全风险意识是必须的,但这种捕风捉影、无中生有的造谣,进而成为恶毒的攻击,也同样是需要坚决反对的。
二、武汉新冠病毒是蝙蝠病毒TG13改造来的?
很多造谣说因为来自蝙蝠的病毒Bat coronavirus isolate RaTG13(简称TG13)和武汉新冠病毒同源性高于96%,所以这是“武汉新冠病毒是实验室人工病毒泄露”的证据。讲真,我真不知道这样跳跃的逻辑是怎么来的。那么我就根据TG13和新冠病毒基因组序列特点进行分析。
TG13基因组见:https://www.ncbi.nlm.nih.gov/nuccore/1802633852 。和武汉新冠病毒做alignment看,如图9,没问题,同源性较高,96.1%,和最新的报道(https://www.biorxiv.org/content/10.1101/2020.01.22.914952v1.full )描述一致。而且的确在目前所有蝙蝠来源的冠状病毒中和武汉新冠病毒具有最近关系(图10)。这的确意味着,TG13很可能是武汉新冠病毒的最初来源。
图9 武汉新冠病毒基因组和TG13基因组合比较
图10 TG13和武汉新冠病毒关系(红字部分)
那么这能作为““武汉新冠病毒是实验室人工病毒泄露”么?显然,稍有分子操作和分子演化知识的人都能看出:不会。
一个基础知识:人工分子操作,最常规的是对序列的剪接,也就是剪下【一段】序列,然后连接到另一段序列之中。请注意关键词:一段。而在很长时间里,并没有好的技术能够做到对单个碱基进行有效改变,直到基因编辑技术出现后,才能比较方便的进行人工单碱基突变。但是目前依然没有较好的手段进行同一线性DNA分子上的多个位点同时点突变,而诸如错配PCR等技术对于构建具有众多突变位点的大片段仍力有不逮。
而自然突变则完全不同。自然突变,尤其对于病毒这种基于复制的基因组来说,其基本变异模式正是在复制过程中由于随机原因造成的点突变。并且理论上,这种点突变是整个基因组中随机产生的,因此应均匀地分布在整个基因组中。最多因为涉及到一些关键基因(保守基因),在这些保守区的突变相对较少而已。
因此在序列比较上,一眼就能看出,TG13和新冠病毒基因组的差异是散布的,没有连续成段的拷贝发生,这显然是一个经过自发的点突变而来的结果。
我们来再来看看被某个”博士“津津乐道的“100%相同的E基因”。通过基因组序列比对可以看出,其实上在E基因中,存在1个碱基的突变(图11)。不过这个突变并没有造成氨基酸序列的改变,因此的确TG13的E基因蛋白序列和新冠病毒一致。
图11 E蛋白基因序列比较
那这是否说明新冠病毒是“人工改造”来的呢?恰恰不能。这是因为E基因的编码区只有228个碱基,长度只有整个基因组长度的不到1%,而整个近30000碱基的TG13和新冠病毒基因组上只有1188个碱基差异,更说明自发突变不易落在如此短的E基因内,无法作为“人工改造”的证据,倒恰恰说明这是一个自发突变而来。
基因的人工操作和自然突变的特征本身是极为显著的。完全无视那些分散的点突变,非要去纠结短片段的“一致性”,这恰恰说明质疑人缺乏基本的分子生物学和分子演化知识。
此外,回答下一直有人提出问题的:
1、到底是云南蝙蝠还是舟山蝙蝠?
其实仔细阅读论文(https://www.tandfonline.com/doi/pdf/10.1038/s41426-018-0155-5 )可以发现,TG13是来源于云南的蝙蝠(图10,蓝色箭头),而所谓舟山蝙蝠,其实是ZC45冠状病毒的来源(图10,绿色箭头)。在之前的分析中,由于ZC45和新冠病毒关系较近,有人认为是舟山来源。但从目前的证据看,来源于云南蝙蝠的TG13更有可能是武汉新冠病毒的最初来源。
2、中间宿主是怎么回事?
其实中间宿主的作用是这样的,对于蝙蝠中的病毒A(A可能没有侵染人体的能力),在进入中间宿主后,A会由于该动物体内细胞对突变进行筛选而变化为B,而B可能具有感染人的能力。这在野外是一个十分通常的现象。反而在实验动物中,人们为了要求实验的一致性,会对原病毒A进行保种,每次操作都用A来做,不会放任病毒变异为B。并且重要的是,TG13病毒发现和被分离到现在的时间无法造成如此众多的点突变。因此说“通过实验动物作为中间宿主感染人类”,其实是没读懂论文罢了。
三、“武汉新冠病毒内有一段独特的插入序列”?“含有人工载体pShuttle-SN序列”?
这次的消息来自国外,说“武汉新冠病毒内有一段独特的插入序列”,号称“所有蝙蝠冠病毒和SARS病毒都缺少这一序列”,以此来说明武汉新冠病毒是人工构建的(图12),还煞有介事的说这段序列是“人工载体pShuttle-SN序列”,以此来证明武汉新冠病毒是人工构建的。这个消息在外网上流传甚广。那么这一段,我要打洋大人的脸了。
图12:网传流言截图
首先,之前武汉新冠病毒的基因组之前已经发过了。随便搜一下pShuttle-SN,很容易得到这个载体序列信息(链接:https://www.ncbi.nlm.nih.gov/nuccore/57791694 ),一看我就笑了:这其实是一个装载了一段SARS病毒S蛋白N端序列的一个表达载体(图13)。这里我就大概明白怎么回事了。
图13:pShuttle-SN序列,注意黄色注释。
首先来看看有没有一个“独特的插入序列”。我选择了三个来自蝙蝠的冠状病毒(TG13、ZC45、SHC014)、两个SARS病毒毒株(SARS-BJ202、SARS-CV7)这5条基因组分别作为蝙蝠冠病毒和SARS病毒的代表,因为计算机性能限制,我选择了它们和武汉新冠病毒的20000~24000碱基区间(也就是所谓插入序列所在位置),进行alignment,结果如图14。
图14:三个蝙蝠冠状病毒、2个SARS病毒和新冠病毒20000~24000nt范围比较
说好的“独特的插入片段”呢?如果是一个插入片段,那应该产生一个空缺(gap)啊,但是显然,S蛋白N端只有一个同源性较差的区域,但并没有gap存在啊。
没关系,洋大人还温馨的提供了所谓“插入片段的序列(链接:https://jameslyonsweiler.com/wp-content/uploads/2020/02/inserted-portion.txt ),行,导入,然后和那6条病毒序列进行比对,如图15
图15:加入所谓“插入片段”后的比较
很显然,这段序列并非“武汉新冠病毒特有的插入序列”,它只是一段和蝙蝠冠状病毒、SARS病毒同源性较低的片段而已——这在不同病毒中太常见了,压根不是“特殊的插入”。
好,那再看看那个“pShuttle-SN”是怎么回事。用pShuttle-SN和武汉新冠病毒比较,如图16。洋大人们,你们眼瞎吗?哪里看到武汉新冠病毒上有来自pShuttle-SN的序列?
图16:pShuttle-SN和新冠病毒序列比较
其实,图13就说明了这个问题的答案。用pShuttle-SN和SARS病毒基因组比较后,可以看到,pShuttle-SN和SARS基因组的S蛋白有一段几乎一模一样的区域(图17)。其实,这段区域本身就是来自SARS病毒S蛋白基因的序列——毕竟,这就是一个表达该蛋白的载体嘛。
图17:pShuttle-SN和SARS病毒序列比较
综上,所谓“武汉新冠病毒内有一段独特的插入序列”以及“武汉新冠病毒含有人工载体pShuttle-SN序列”是两个子虚乌有的事情。我强烈怀疑那位所谓的“美国科学家James Lyons-Weiler”缺乏分子生物学的相关知识,才会写出那样捕风捉影、搬弄是非的文章出来——或许,他有别的什么目的?